Già Galileo intuiva il fatto che "natura non faciet saltus": i fenomeni fisici comuni sono intrinsecamente continui.
Tutti i fenomeni che rispettano le leggi della fisica classica si possono descrivere nel modo più accurato usando modelli continui.
Per questo la gran parte dei sistemi di interesse applicativo ha caratteristiche continue, anche se esistono importanti sistemi fisici che possono essere considerati discreti, come gli automi a stati finiti, che tratteremo nel prossimo capitolo, ed i computer, che tratteremo a partire dal quarto capitolo.
A partire dagli inizi del ventesimo secolo una serie di risultati sperimentali e di costruzioni teoriche ha "smantellato" i fondamenti della fisica classica, scoprendo la natura corpuscolare e discreta della materia nel suo intimo.
Ciò peraltro non ha influenza sulla maggior parte dei sistemi che si usano nella tecnica, perché quei sistemi hanno un numero tanto grande di atomi da ammettere una rappresentazione continua praticamente perfetta.
Nella prima parte di questo capitolo si dà una definizione matematica molto generale di sistema, che vale per tutti i sistemi, ma che è più immediatamente applicabile ai sistemi continui.
Nel seguito si esporranno alcuni concetti di teoria dei controlli, che hanno fertili ricadute anche in altri campi.
Descrizione matematicaDaremo ora un inquadramento più formale ai concetti espressi in modo qualitativo nel capitolo precedente. Cominceremo con una forma astratta e generale delle funzioni che governano il funzionamento dei sistemi, presentando in seguito alcuni esempi.
Relazioni fra gli elementi del sistema VettoriPer dare una formulazione matematica al concetto di sistema dobbiamo enunciare la definizione matematica di "vettore".
Per poterla giustificare intuitivamente partiamo definizione di vettore già nota dalla Fisica.
Un vettore in Fisica è un'entità che descrive una forza ed è caratterizzata da:
- un punto di applicazione
- un'intensità
- una direzione
- un verso.
Se il vettore è piano esso può essere disegnato su un foglio e le quattro caratteristiche testè elencate possono essere ridotte a due numeri, come si può vedere nella Figura 14.
Per giustificare quest'affermazione stabiliamo l'origine del piano nel punto di applicazione del vettore; l'intensità del vettore è rappresentata dalla distanza dall'origine, la direzione ed il verso possono essere indicati dall'angolo formato fra il vettore ed una semiretta di riferimento (vedi Figura 14).
Nella Figura 14, punto (a) la distanza dall'origine del sistema di riferimento è indicata dalla lettera d e l'angolo dalla lettera a.
Per indicare un vettore si scrivono i due numeri che lo "rappresentano", fra parentesi tonde, separati da una virgola:
(<PrimaCoordinata>,<SecondaCoordinata>)
Dove <PrimaCoordinata> e <SecondaCoordinata> vengono sostituiti da numeri.
L'origine del piano è il vettore (0,0).
E' molto importante notare che l'ordine con cui si scrivono i numeri è decisivo.
Se per esempio supponiamo che la prima coordinata sia la distanza dall'origine e la seconda l'angolo, i vettori (6, 2) e (2, 6) sono del tutto diversi. Nel primo 6 è la distanza e 2 l'angolo, nel secondo 6 è l'angolo e 2 la distanza.
Oltre che nelle coordinate posizione – angolo, che vengono dette coordinate polari, si può rappresentare un vettore anche in coordinate cartesiane.
Le coordinate cartesiane sono i due numeri che si ottengono effettuando la proiezione ortogonale dell'estremo del vettore su due assi di riferimento perpendicolari (assi cartesiani). Le coordinate che si ottengono in questo modo spesso si chiamano "coordinata x" e "coordinata y", anche se non è sempre così. In Figura 14, punto (b), si può vedere la generazione delle coordinate cartesiane dello stesso vettore del quale al punto (a) sono illustrate le coordinate polari.
Figura 14: (a) e (b) vettore in due dimensioni (c) vettore in tre dimensioni
Dunque anche nel caso delle coordinate cartesiane ciò che ci serve per individuare un vettore sono due numeri.
Generalizzando possiamo dire che un vettore del piano è una coppia ordinata di numeri.
Se passiamo allo spazio in tre dimensioni ci serve un'altra coordinata, come illustrato dalla Figura 14, parte (c). Il vettore di tre dimensioni è dunque una tripletta ordinata di numeri.
Estendiamo ora il concetto ad uno spazio con un numero qualsiasi di dimensioni ("iperspazio"), che possiamo immaginare, anche se non riusciamo a disegnarlo. Estendendo le definizioni precedenti possiamo dire che:
Un vettore in uno spazio ad n - dimensioni è una n – upla ordinata di numeri.
Una notazione simbolica molto comoda per i vettori consiste nel sovrapporre al nome una piccola freccia:
_
v
Perciò quando si usa un simbolo con il segno di vettore non si intende un solo numero, ma un insieme ordinato di n numeri, ciascuno dei quali ha con il suo "posto" nel vettore.
Gli ingressi, le uscite e le variabili di stato di un sistema possono essere molti, ciascuno indipendente dagli altri, per cui essi sono vettori.
Nel seguito indicheremo il vettore degli ingressi, dello stato e delle uscite rispettivamente come:
_ _ _
i s u vettore degli ingressi, vettore dello stato, vettore delle uscite
scrivere:
_
i significa scrivere (i1, i2, i3, .. , .. , in-1, in)
dove n è il numero di elementi del vettore degli ingressi (cioè il numero degli ingressi del sistema!).
Si dice ordine di un sistema il numero degli elementi di accumulo del sistema, cioè il numero di elementi del vettore dello stato.
Come esempio assegniamo i vettori delle variabili di un sistema. Consideriamo il carrello su montagne russe analizzato nel capitolo precedente.
Stato:
Avevamo già stabilito nel capitolo precedente che lo stato era costituito da due variabili: la posizione lungo il binario e la velocità del carrello. Il numero di elementi del vettore delle variabili di stato è perciò 2.
Stabiliamo di indicare la posizione come primo numero del vettore dello stato; chiamiamo p(t) il valore della posizione del carrello in ogni istante di tempo t.
Stabiliamo ora che il secondo elemento del vettore dello stato sia la velocità del carrello; indichiamo la velocità in ogni istante come v(t).
Il vettore dello stato si potrà scrivere così:
_
s (t) = (s1(t), s2(t)) = (p(t), v(t))
Lo stato è la coppia ordinata (p(t), v(t)), ove la posizione occupa sempre la prima posizione.
Il vettore di stato ha due elementi, per cui il sistema è del secondo ordine.
Ingressi :
Stabiliamo le variabili di ingresso del nostro sistema ed il relativo vettore degli ingressi.
Ad ogni "giro" del carrello salgono nuovi passeggeri, che hanno massa diversa. Perciò la massa totale del carrello e dei passeggeri è una variabile indipendente del sistema; la consideriamo un suo ingresso. Indichiamo con m(t) la funzione che esprime la massa del sistema in ogni istante t e stabiliamo che essa abbia il primo posto nel vettore degli ingressi.
Un meccanismo di trascinamento porta il carrello sulla sommità dell'impalcatura. Esso applica una forza al carrello; la consideriamo un ingresso del sistema. Chiamiamo fm(t) questa forza (forza motrice) e decidiamo di assegnarle il secondo posto nel vettore degli ingressi.
Per frenare il carrello alla fine della sua corsa esso avrà un sistema frenante, che applica la forza fr(t), che metteremo al terzo posto del vettore.
Considerando che non ci siano altri ingressi significativi, le variabili di ingresso devono essere tre, come gli elementi del vettore di stato che, per quanto detto, sarà:
_
i (t) = (i1(t), i2(t) , i3(t)) = (m(t), fm(t) , fr(t))
Uscite:
Supponiamo ora che l'analisi di questo sistema abbia lo scopo di valutare se un giro nelle montagne russe può creare danni alla salute dei nostri clienti.
L'analisi dovrà evidenziare se l'accelerazione massima che i passeggeri subiscono è inferiore ad una soglia. Consideriamo perciò l'accelerazione in ogni istante come un'uscita del sistema, che chiamiamo a(t) e scriviamo al primo posto del vettore delle uscite.
Il problema da risolvere include anche il dimensionamento dei dissipatori termici del sistema frenante. Per stabilire quanta energia essi dovranno dissipare sarà necessario conoscere il valore dell'energia cinetica che il carrello possiede nel punto in cui i freni entrano in azione. Chiamiamo c(t) l'energia cinetica in ogni istante ed assegniamole il secondo posto.
Per impressionare i nostri clienti vogliamo far loro sapere qual è stata la velocità massima che hanno raggiunto nel loro giro mozzafiato. Inseriamo perciò v(t) nel vettore delle uscite, al terzo posto.
Il vettore delle uscite sarà perciò composto dai seguenti elementi:
_
u (t) = (u1(t), u2(t) , u3(t)) = (a(t), c(t) , v(t))
Dunque il nostro sistema ha due ingressi, tre uscite ed ha vettore di stato con due elementi (ordine 2).
Le risposte che ci interessano ci saranno date risolvendo matematicamente le equazioni del sistema, ricavate dalle leggi fisiche, oppure effettuando una simulazione al computer delle stesse leggi.
Per la rappresentazione matematica del sistema l'ordine dei vettori appena stabilito dovrà essere sempre rispettato, mettendo sempre ogni variabile del sistema al posto che le compete.
Funzioni del sistema
Come già detto nel capitolo precedente lo stato è la memoria del sistema. In esso si accumula tutto ciò che del passato lascia traccia, per cui le uscite del sistema non possono dipendere dal passato se non attraverso lo stato.
La frase precedente si può formalizzare matematicamente ipotizzando che esista una funzione, detta "funzione di uscita" o "di trasformazione", che lega le uscite agli ingressi ed allo stato.
Si può quindi scrivere così:
_ _ _ _
u(t) = g (s(t), i(t))
_
la "funzione di uscita" g è una funzione vettoriale (notare la freccia sopra la g), cioè l'insieme ordinato di tante funzioni quante sono le uscite del sistema.
Se il sistema ha n uscite queste funzioni si possono scrivere come:
_ _ _ _
u(t) = (g1 (s(t), i(t), g2 (s(t), i(t), .. , gn (s(t), i(t))
_
g è funzione dello stato e dell'ingresso al tempo t. Essa "trasforma" stati e ingressi in uscite e per questa ragione viene anche detta funzione di trasformazione.
L'espressione precedente significa che le uscite in un qualsiasi istante generico t sono funzione degli stati e degli ingressi in quello stesso istante t (il simbolo t, che rappresenta l'istante attuale, è presente sia a destra che a sinistra dell'uguale).
Dato che gli ingressi sono elementi "esterni" al sistema non possono tener memoria del suo passato; l'espressione precedente mostra perciò come l'influenza sull'uscita del sistema di tutti gli ingressi passati si applica solo attraverso lo stato.
Dunque il passato degli ingressi deve influenzare lo stato del sistema.
Per rendere esplicita questa influenza dobbiamo introdurre un'altra funzione, che chiameremo "funzione di transizione", che si esprime in questo modo:
_ _ _ _
s (t) = f (s (t0), i [t0 .. t))
t0 è uno specifico istante di tempo detto istante iniziale, mentre t è un generico istante, t, detto istante attuale.
L'istante iniziale deve precedere l'istante attuale. A t si può sostituire qualunque valore, a patto naturalmente che t >= t0.
_
_
s (t0) è lo stato all'istante iniziale, che viene detto condizione iniziale
_
i [t0 .. t) con questa notazione si intende che questo vettore rappresenta tutti gli ingressi applicati al sistema in tutto il periodo di tempo che va da t0 a t (*)
(*)
Questa funzione risponde perciò alla definizione di "eccitazione" (o "sollecitazione") del sistema, data nel capitolo precedente.La precedente espressione si legge così: lo stato in un qualunque istante generico t è funzione dei valori del vettore di stato in uno specifico istante iniziale t0 e di tutti gli ingressi applicati al sistema in tutto il tempo intercorso fra l'istante iniziale t0 e l'istante corrente t.
_ _
La funzione di transizione f è una funzione vettoriale, costituita, come g, da un certo numero di funzioni "componenti". La conoscenza della funzione di transizione permette di determinare, noto lo stato iniziale e gli ingressi, lo stato futuro in ogni istante. Essa determina perciò come si modifica lo stato, cioè la sua "transizione".
Riepiloghiamo in breve quanto visto in questo paragrafo. Il comportamento di un qualsiasi sistema è determinato da due funzioni; la funzione di transizione determina come si modifica lo stato nel tempo, mentre la funzione di uscita determina il valore delle uscite in ogni istante.
In questo testo chiameremo queste due funzioni "funzioni del sistema".
_ _ _ _
s(t) = f (t, s(t0), i [t0 .. t))
funzioni del sistema invariante
_ _ _ _
u(t) = g (t, s(t), i(t))
Formulazioni particolari delle funzioni del sistema
Nella formulazione appena data le funzioni di transizione e di uscita sono costanti nel tempo, per cui il comportamento del sistema rimane sempre lo stesso, indipendentemente dal tempo.
Se applichiamo in momenti diversi le stesse eccitazioni a partire da stati uguali otteniamo sempre lo stesso stato e le stesse uscite.
Questa è la definizione di sistema invariante, per cui le equazioni precedenti sono valide solo per sistemi invarianti.
La gran parte dei modelli usati nella pratica sono sistemi invarianti.
Per i sistemi varianti si può introdurre nelle funzioni precedenti una dipendenza esplicita dal tempo:
_ _ _ _
s(t) = f(t, s(t0), i [t0 .. t))
funzioni del sistema variante
_ _ _ _
u(t) = g(t, s(t), i(t))
_ _
Con questa scrittura vogliamo significare che f e g sono funzione esplicita del tempo, perciò cambiano con il tempo, dunque il comportamento del sistema è "variante nel tempo".
Se un sistema è combinatorio non ha lo stato per cui le funzioni del sistema si riducono ad una:
_ _ _
u(t) = g (i(t)) funzioni del sistema combinatorio (una sola!)
in questo caso le uscite al tempo t sono una funzione "algebrica" degli ingressi. Questa funzione viene applicata istantaneamente, come si vede dal fatto che c'è solo la variabile t a destra e a sinistra del segno di eguaglianza.
Infatti, come già detto, il sistema combinatorio non ha ritardi.
Se un sistema è statico è sempre fermo; non c'è dipendenza dal tempo e non ci può essere lo stato, dato che il passato è uguale al presente ed al futuro, per cui le funzioni del sistema si riducono a:
_ _ _
u = g ( i ) funzioni del sistema statico (una sola!)
_ _ _ _
si noti che i non è funzione del tempo e di conseguenza anche u, i ed u sono vettori di valori costanti.
Se il sistema è chiuso non c'è la funzione di uscita, né esistono ingressi, per cui:
_ _ _
s(t) = f (s(t0)) funzioni del sistema chiuso (l'uscita non esiste)
la funzione ci conferma il fatto che il sistema evolve a spese della sua energia interna, "immagazzinata" nelle variabili di stato all'istante iniziale s(t0).
Per prevedere il futuro di un sistema dobbiamo perciò conoscere: _
- la funzione di transizione del sistema, o di un suo modello sufficientemente accurato: f
_
- le condizioni iniziali da cui il sistema parte: s(t0)
_
- gli ingressi che abbiamo applicato i [t0 .. t)
_
- gli ingressi che applicheremo: i [t0 .. t) (ricordiamo t è variabile, per cui lo possiamo portare anche nel "futuro"!)
Se il sistema è osservabile dell'esterno e siamo interessati a conoscerne anche le uscite dovremo conoscere anche:
_
- la funzione di uscita: g
Esempio:
Analizziamo il funzionamento di un maglio per la demolizione degli edifici, illustrato in Figura 15.
Esso è un pendolo che viene alzato da un verricello fino ad un certo angolo iniziale, poi, lasciato improvvisamente, va a colpire il muro dell'edificio, devastandolo.
Lo scopo della nostra analisi è il dimensionamento della massa del maglio, della lunghezza del cavo e dell'angolo iniziale in modo che l'energia cinetica del maglio sia sufficiente per la distruzione del muro.
Consideriamo quindi come ingresso la massa del maglio (m) e la lunghezza del cavo (l), mentre l'angolo iniziale è una condizione iniziale.
L'uscita del sistema sarà l'energia cinetica del maglio, il valore dell'uscita cui siamo interessati è quello dell'istante in cui l'angolo vale 0 (deve essere a = 0).
Lo stato del sistema è costituito da due elementi: posizione e velocità sulla traiettoria.
Le condizioni iniziali sono i valori dello stato nell'istante iniziale; sono perciò i valori dell'angolo e della velocità lungo la traiettoria nell'istante in cui il maglio viene lasciato cadere.
Il parametro del sistema è l'accelerazione di gravità g.
Figura 15: un modo di usare un pendolo
La soluzione matematica del problema del pendolo, non tenendo conto dell'attrito e considerando il caso in cui l'angolo sia sempre piccolo, è la seguente:
Dove:
_
s(t) è la funzione di transizione, che dà gli elementi del vettore dello stato in ogni istante
a
(t) è l'angolo del pendolo con il perno, in ogni istante, è un elemento del vettore di statov(t) è la velocità angolare in ogni istante (in rad/s), è un elemento del vettore di stato
a
0 e v0 sono la posizione (angolo) e la velocità iniziale angolari_
il vettore degli ingressi i è costituito dai due elementi m(t) e l(t), massa della sfera e lunghezza del cavo, che si considerano funzioni "a gradino" (vedi oltre). Queste funzioni hanno valore 0 per il tempo t < t0 e sono costanti per tutto il tempo che ci interessa (t>= t0)
_
il vettore delle uscite u ha un solo elemento, l'energia cinetica, che viene calcolata elevando al quadrato la velocità lineare e dividendo per due. La velocità lineare viene ottenuta moltiplicando quella angolare per l, raggio di curvatura.
Nel CDROM allegato al volume è compreso il file Maglio.xls che permette di sperimentare con la funzione di transizione, provando con valori diversi di condizioni iniziali.
Si ricorda che la funzione di transizione qui riportata è approssimata ed è valida solo per angoli molto piccoli. Per angoli grandi essa non descrive adeguatamente il sistema.
La cosa si può apprezzare chiaramente impostando nella tabella Maglio.xls un valore della velocità iniziale molto alto. Il buon senso ci dice che il pendolo, senza attrito, se riesce a fare un giro completo non si fermerà più e non tornerà più indietro. Nel nostro modello approssimato non c'è modo di far girare sempre avanti il pendolo, che torna sempre indietro!
Se consideriamo sempre nulla la velocità angolare iniziale (maglio fermo) la funzione di transizione si semplifica:
La funzione di transizione di un sistema si calcola applicando le "leggi della natura" che lo regolano; esse possono essere leggi fisiche, chimiche, biologiche, economiche od ecologiche.
La gran parte di queste leggi viene espressa sotto la forma di particolari equazioni.
Se il sistema è statico le equazioni in gioco sono ordinarie equazioni, algebriche o trascendenti.
Un'equazione è un'espressione che contiene un'incognita e un'uguaglianza. L'incognita è una variabile, che può assumere ogni valore. Solo alcuni valori dell'incognita rendono vero il segno d'uguaglianza. Quei valori sono le soluzioni dell'equazione.
Se le incognite sono più di una si deve ricorrere ai sistemi di equazioni, nei quali tutte le eguaglianze debbono valere contemporaneamente.
Consideriamo il caso del dinamometro statico, già descritto nel Capitolo 1.
Il modello della molla era già stato enunciato:
Fe = - k x
Fe è la forza elastica applicata dalla molla, k è la costante di elasticità della molla, x è lo spostamento dell'estremo della molla rispetto alla sua posizione di riposo.
Se il dinamometro è usato come bilancia, esso misura la forza peso di una massa ad esso collegata, che è data da:
Fp = - m g
Se il sistema è statico, non è in movimento e la massa non accelera. Le forze devono essere equilibrate; Fp ed Fe sono le uniche forze, per cui l'applicazione delle leggi della fisica conduce a:
Fe = - k x = - m g = Fp
La posizione della molla misura la massa dell'oggetto in questo modo:
Tutti i problemi sui sistemi statici possono essere risolti risolvendo equazioni più o meno complicate.
Se le incognite sono più di una la soluzione si trova risolvendo un sistema di equazioni.
Vediamo ora un esempio la cui soluzione richiede un sistema di equazioni algebriche.
L'ufficio approvvigionamenti di una piccola azienda chimica ha a disposizione un budget 8 kEuro, da destinarsi interamente all'acquisto di due reagenti, che chiamiamo Ra e Rb. La quantità di Ra deve essere 10 volte maggiore di quella di Rb. Qual è la quantità di Ra e Rb da ordinare ai fornitori, conoscendone il prezzo?
Il problema si risolve creando un modello che comprende un semplice sistema di equazioni algebriche:
Spesa = KgRa * CostoRa + KgRb * CostoRb
KgRa= RapportoRaRb * KgRb
La prima delle equazioni dice che la spesa totale è la somma della spesa per Ra più quella per Rb, mentre la seconda fornisce il vincolo fra le quantità di reagenti che l'ufficio deve acquistare.
Dati:
Spesa = 8 [kEuro] (variabile indipendente (ingresso))
CostoRa = 1,7 [Euro/kg] (parametro)
CostoRb = 0,12[Euro/kg] (parametro)
RapportoRaRb = 10 (parametro)
Risolvendo insieme le due equazioni si riesce a determinare il valore delle incognite KgRa e KgRb (uscite del sistema).
Quando le incognite sono molte il sistema diventa grande, ma in linea di principio si può risolvere nello stesso modo. Per la soluzione pratica si può fare uso di un computer.
Modelli del genere sono usati in edilizia, per i calcoli di progetto e di verifica degli edifici.
Gli ingressi di un modello di un grattacielo, usato dall'ingegnere che lo ha progettato per assicurarsi, prima di costruirlo, che rimanga in piedi, sono:
- le forze massime che si applicheranno alla struttura in ogni punto, da determinarsi a priori conoscendo la sua destinazione (il pavimento di questa stanza deve reggere mobili o carri armati?)
- i materiali che si impiegheranno nella costruzione della struttura (acciaio, cemento, canne di bambù?)
- la disposizione delle travi e dei pilastri (una porta di dieci metri senza pilastri in mezzo?).
I parametri del sistema possono essere le caratteristiche dei materiali, quali l'elasticità o la resistenza a rottura. Questi parametri sono sempre costanti per ciascun materiale, sono diversi solo se si cambia materiale.
Usando questi ingressi e parametri si costruisce un sistema di equazioni algebriche lineari, con migliaia di incognite e termini noti. La soluzione del sistema, ottenuta tramite un computer, è l'insieme di tutte le "pressioni" all'interno del materiale, in ogni elemento dell'edificio. Ciò permette di verificare se i materiali stabiliti sono adatti e di decidere le dimensioni di travi e pilastri.
Questo modello di edificio è un modello statico, nel quale si considera che le forze siano applicate da sempre e per sempre, che la struttura non si muova, che i materiali non invecchino. In definitiva il tempo è escluso dal modello.
Immaginiamo ora che l'edificio sia sottoposto ad un terremoto. Le posizioni degli elementi della struttura e di conseguenza le forze applicate non sono più costanti. Il tempo entra, drammaticamente, in gioco ed i calcoli descritti precedentemente non sono più validi.
Il sistema non è più statico, ma dinamico.
Se un sistema è dinamico le soluzioni delle equazioni devono essere funzione del tempo. Per questo le equazioni ordinarie, le quali danno come risultato dei numeri fissi, non bastano più per determinare il comportamento di un sistema dinamico.
Le equazioni da usare nella soluzione di problemi dinamici sono le "equazioni differenziali".
Problemi dinamici ed equazioni differenzialiLe equazioni differenziali sono, a parere dell'Autore, la più grande scoperta dell'umanità, paragonabile solo all'uso del linguaggio, all'invenzione della scrittura e del numero zero.
Si può dire che ogni applicazione della tecnica abbia al suo principio la soluzione di qualche equazione differenziale, anche se spesso ciò non è più evidente al giorno d'oggi.
L'importanza delle equazioni differenziali è così grande perché tramite esse si esprimono le leggi della fisica e delle altre scienze. Con esse si producono modelli accurati di sistemi reali e, una volta risolte, esse permettono di prevedere il futuro del sistema analizzato.
Le equazioni differenziali furono inventate indipendentemente da Netwon e Leibniz, verso la fine del 1600.
La grandezza di Netwon, giustamente glorificata da tutti, non sta in intuizioni fortunose derivate da una mela in testa, ma nell'aver scoperto le basi dell'analisi matematica, con lo scopo di dare una spiegazione semplice ai moti dei pianeti. Anche se Netwon non la formulò in modo preciso, il secondo principio della dinamica (F = ma) è la prima equazione differenziale espressa dall'umanità.
La funzione di transizione del maglio o quella della caduta del grave, date precedentemente, così come tutte le formule che si studiano in fisica elementare (moto uniformemente accelerato, moto circolare uniforme ..) sono la soluzione di equazioni differenziali.
Mentre la soluzione di un'equazione ordinaria è un numero fisso, la soluzione di un'equazione differenziale è una funzione del tempo. Questa funzione è in grado di descrivere l'andamento delle variabili del sistema in ogni istante di tempo.
Soluzione analitica o numericaRisolvere un'equazione differenziale è un problema matematico complicato, che richiede una serie di conoscenze che il lettore non può ancora avere. In questo testo non si può e non si vuole dare metodi per il calcolo delle equazioni differenziali, ma solo stimolare la curiosità del lettore e spingerlo ad approfondire i dettagli matematici quando li incontrerà nel suo studio.
Prima dell'avvento dei computer c'erano solo due modi per prevedere il comportamento di un sistema.
Il più rigoroso era la soluzione matematica delle equazioni differenziali del sistema, cioè il calcolo della funzione di transizione. Questo metodo viene detto calcolo della "soluzione analitica" ed è sempre interessante perché spesso permette di scoprire caratteristiche nuove del sistema.
Il secondo modo era la realizzazione di un esperimento con un modello analogico del sistema, come già abbiamo visto nel capitolo precedente (esempio della diga).
A differenza della soluzione analitica, le indicazioni del modello analogico erano per forza imprecise, stante la difficoltà a riprodurre sul modello le stesse situazioni sperimentate dal sistema sotto studio.
Con la disponibilità dei calcolatori si è prospettata una nuova alternativa nello studio dei sistemi cioè la soluzione numerica, o "simulazione", delle equazioni differenziali del modello, con programmi per computer.
La soluzione numerica può essere molto precisa ma può trattare solo casi specifici, mentre la soluzione analitica, oltre ad essere matematicamente esatta, dà risultati generali, validi per tutti i casi.
La soluzione analitica ha dunque importanti vantaggi, anche se per problemi moderatamente complicati diventa difficilissima ed a volte e anche teoricamente impossibile. In questi casi è necessario ricorrere al computer.
Sistemi lineariUn sistema è lineare quando le equazioni che lo descrivono sono assimilabili a quelle della retta.
Questa non è la definizione rigorosa, che qui non ci interessa. Illustreremo informalmente alcune delle proprietà dei sistemi lineari senza scendere nel dettaglio matematico.
Le caratteristiche importanti dei sistemi lineari sono tali e tante che il loro studio è estremamente facilitato, tanto che spesso si usano modelli lineari di sistemi non lineari.
Possono essere ben approssimati con modelli lineari:
- le reti elettriche che contengono resistori, condensatori, induttori
- i sistemi termici
- i sistemi idraulici
- i sistemi meccanici che comprendono forze elastiche (molle) e forze proporzionali alla velocità (ammortizzatori)
Per un sistema lineare vale la "sovrapposizione degli effetti".
Un sistema lineare
Esempio:
Il più semplice sistema lineare combinatorio, quello che ha un solo ingresso ed una sola uscita, ha il seguente modello matematico:
u(t) = A i(t)
l'uscita è proporzionale all'ingresso attraverso il parametro A e, naturalmente, non dipende dallo stato, che qui non esiste (sistema combinatorio). Fra ingresso ed uscita c'è dunque una relazione "algebrica". Per questa ragione i sistemi lineari combinatori vengono anche detti "algebrici".
Un amplificatore audio ideale è un sistema che segue il modello appena definito; il parametro A è il suo "guadagno" di amplificazione.
Se un amplificatore ideale riceve in ingresso un segnale qualsiasi i(t) lo restituisce alla sua uscita aumentato ("amplificato") del fattore A (A i(t)).
A voler ben vedere, si può dire che i sistemi fisici non sono mai lineari, perché ogni fenomeno naturale ha limitazioni "energetiche", che non lo fanno comportare come un "vero" sistema lineare in ogni condizione.
Infatti un sistema lineare deve rispondere SEMPRE in modo lineare, anche quando sottoposto a ingressi di contenuto energetico tale da far degradare o distruggere un sistema reale.
Un esempio: se "urliamo" troppo forte dentro un microfono collegato ad un amplificatore, l'amplificatore andrà in saturazione, comincerà a distorcere e la nostra voce non sarà più riprodotta esattamente. Questo non potrebbe accadere se il sistema fosse davvero sempre lineare, perché esso amplificherebbe sempre esattamente il segnale di ingresso indipendentemente da quanto esso è "forte".
Figura 16: se l'amplificatore distorce non è più lineare
Quindi ogni sistema reale ha un modello lineare solo in un intorno più o meno grande di un suo punto di equilibrio.
E' importante studiare i sistemi lineari perché ogni sistema fisico, in un intorno sufficientemente piccolo di un punto di equilibrio stabile, ha un comportamento lineare è può quindi essere studiato con un modello lineare.
La stabilità dei sistemi lineari è molto particolare. Essa infatti non dipende in alcun modo dagli ingressi applicati, né dallo stato iniziale del sistema.
Questo significa che nei sistemi lineari la stabilità è una caratteristica del sistema non di un particolare equilibrio sotto particolari condizioni.
Solo per i sistemi lineari si può quindi parlare di sistema stabile, mentre in generale si dovrebbe parlare di "condizione di equilibrio stabile".
Di conseguenza se un sistema lineare non è stabile, è un sistema instabile.
Sistemi di controlloUn sistema automatico o "sistema di controllo" (control system) è un sistema che è in grado di raggiungere autonomamente un obiettivo prefissato, con un minimo intervento umano. L'intervento umano si deve limitare stabilire gli obiettivi.
In un sistema automatico si possono distinguere due componenti principali (vedi Figura 17).
Uno è il sistema da controllare, che nella letteratura tecnica va sotto il nome di "plant" (impianto). (*)
(*) il nome spiega l'origine dei primi sistemi di controllo industriale, che erano indirizzati alla regolazione di impianti termici o chimici.
L'altro elemento principale del sistema di controllo è quello che, operando opportune "politiche" di regolazione, ha la responsabilità di ottenere i risultati richiesti.
A questo elemento si danno molti nomi; per esempio: controllore, regolatore, servo, driver. Ciascuna di queste denominazioni può portare sottili differenze, che peraltro non indagheremo in questa sede.
Di solito si intende per "sistema di controllo" l'intero sistema automatico, comprensivo di plant e controllore.
Figura 17: sistema di controllo
Scopo di un sistema di controllo è fare in modo che le uscite del plant raggiungano e mantengano i valori desiderati.
L'unico modo per ottenere questo risultato è intervenire sugli ingressi del sistema da controllare, od almeno su alcuni di essi.
Vengono dette "variabili manipolabili" del plant i suoi ingressi su cui il controllore è in grado di intervenire.
Il controllore agirà autonomamente per raggiungere gli obiettivi della regolazione. Per conoscere questi obiettivi esso possiede uno o più ingressi, detti "ingressi di riferimento" o, più comunemente, "set point" (**).
L'intervento umano consisterà nell'impostazione dei set point.
(**) i set point "stabiliscono" (set) il "punto di lavoro" (point) del controllore.
Sistemi in catena aperta
L'architettura del sistema di controllo illustrato dalla Figura 17 delinea quello che viene detto sistema di controllo in "catena aperta" (feedforward o anche open loop).
In un sistema automatico in catena aperta il regolatore effettua la sua azione di controllo, ma non ha modo di verificare quale è stato il suo effetto. Dunque se le condizioni del sistema da controllare cambiano, l'azione di controllo del regolatore in catena aperta può divenire inefficace.
Un esempio di sistema di controllo in catena aperta è il condizionatore di un'automobile, che estrae dall'abitacolo una quantità di calore proporzionale all'angolo cui è impostata la sua manopola. Sulla manopola ci sarà scritto il valore della temperatura che dovrebbe essere raggiunta, determinato dal costruttore. La posizione della manopola costituisce il set point del sistema di controllo.
Dato però che il condizionatore non fa nessuna misurazione, né della temperatura esterna, né di quella dell'abitacolo, la temperatura interna si potrebbe portare a valori troppo alti o troppo bassi. Questo accade se, per esempio, cambia la temperatura esterna, oppure se il potere frigorigeno del condizionatore diminuisce con l'usura.
In questi casi la stessa posizione della manopola corrisponderebbe a temperature diverse. A questo punto potrebbe intervenire il guidatore, cambiando la posizione della manopola, ma il sistema non sarebbe più del tutto "automatico".
Per migliorare le prestazioni dei sistemi di controllo si introducono regolatori in catena chiusa, o in "feedback" (retroazione).
Retroazione (feedback)Il concetto di retroazione è pieno di significato ed ha validità del tutto generale. E' utile in molti contesti, anche nei sistemi non continui. Peraltro è più facile da illustrare per i sistemi continui ed una sua applicazione diretta è la regolazione. Per questo è presentato in questo capitolo.
Un sistema ha una retroazione quando almeno una delle sue uscite è in grado di influenzarne il comportamento, perché viene riportata all'ingresso.
In Inglese si usa il termine feedback (to feed = alimentare, back = indietro) che, oltre che con "retroazione", viene anche tradotto con "reazione" e "controreazione".
Figura 18: sistema in retroazione
Per spiegare il concetto di retroazione è utile riferirsi ad uno dei primi dispositivi che ne fece uso, cioè al regolatore di Watt. Esso è un dispositivo meccanico che regola la velocità di un albero rotante mosso dal vapore di una caldaia.
E' costituito da due sfere che, ruotando insieme all'albero, tendono a sollevarsi per forza centrifuga, trascinando in alto una valvola di sfogo che, mano a mano che si apre, fa diminuire la pressione del vapore proveniente dalla caldaia.
Se per una qualsiasi ragione la velocità dell'albero tende ad aumentare, la valvola si apre di più e perciò esce più vapore e la pressione diminuisce. Di conseguenza anche la velocità di rotazione dell'albero diminuisce. Se la velocità invece tende a calare la valvola si chiude e la velocità aumenta.
Dunque questo sistema tende a mantenere automaticamente la velocità dell'albero ad un valore costante. La geometria del sistema è modificabile tramite rinvii mobili, per cui si può anche stabilire il set point della velocità.
Il meccanismo del regolatore di Watt si basa sulla retroazione. La velocità dell'albero viene misurata tramite la forza centrifuga e viene utilizzata per correggere la variabile manipolabile del sistema (pressione del vapore). Dunque l'uscita (velocità) viene "riportata" all'ingresso del sistema, che diventa più stabile.
Figura 19: regolatore di Watt
Come ulteriore esempio di sistema in retroazione consideriamo il climatizzatore di un'automobile.
Con questo sistema l'automobilista può impostare il valore della temperatura desiderata. Il controllore riceve un segnale da un misuratore di temperatura e può regolare la quantità del calore da estrarre in base alla temperatura dell'abitacolo. Se la temperatura esterna aumenta, il flusso di calore estratto dal climatizzatore non basta più. Allora aumenta leggermente anche la temperatura dell'abitacolo. Ma il climatizzatore misura questo aumento e provvede subito ad aumentare il calore estratto, riportando la temperatura al valore desiderato senza ulteriore intervento del guidatore.
Già con questo semplice esempio, da confrontare con quello del condizionatore, è possibile rendersi conto della principale differenza fra sistemi di controllo in retroazione ed in catena aperta.
I sistemi in retroazione sono estremamente meno sensibili alle variazioni di funzionamento nel plant ed ai disturbi.
Nei sistemi in catena aperta, che non possono misurare l'uscita, ogni spostamento del sistema dalle condizioni per cui il controllore è stato progettato implica una variazione "non recuperabile" dell'uscita di tutto il sistema.
Il sistema in catena chiusa invece si può rendere conto che l'uscita non è quella desiderata, per cui può reagire ai disturbi cambiando la sua legge di regolazione. La variazione dell'uscita dovuta ad un cambiamento delle caratteristiche del plant sarà senz'altro molto minore di quella di un sistema a catena aperta e spesso potrà essere del tutto annullata.
Dato il loro evidente vantaggio, al giorno d'oggi i sistemi in retroazione sono impiegati nella maggioranza dei casi; si usano ancora sistemi in catena aperta quando la misura dell'uscita è impossibile o troppo costosa e quando si vogliono limitare al minimo i costi del controllore e non sono richieste al sistema di controllo prestazioni particolarmente "spinte".
Esempio:
I sistemi di riscaldamento domestico sono spesso in catena aperta, perché è costoso equipaggiare ogni radiatore con una valvola termostatica o con un regolatore elettrico.
Altre volte hanno un ingresso di correzione, che permette di migliorare le prestazioni del regolatore in catena aperta. Infatti il regolatore legge un sensore che misura la temperatura ambiente esterna, così da modificare la legge di controllo in base alla temperatura misurata.
Questo tipo di regolazione fa uso di una misurazione, ma non può dirsi vero e proprio sistema in retroazione, perché l'uscita, cioè la temperatura dell'appartamento, non interviene direttamente sul regolatore.
Un semplice schema di un sistema di controllo in retroazione, con un solo ingresso ed una sola uscita, è presentato in Figura 20. Balza agli occhi la presenza di due nuovi sottosistemi, identificati come "trasduttore" ed "attuatore".
Il trasduttore è un sistema per la misurazione dell'uscita
La grandezza in ingresso al trasduttore è l'uscita del sistema da controllare ed ha un'unità di misura qualunque (che dipende dal sistema!). Essa viene trasformata dal trasduttore in un'altra grandezza che, tipicamente, ha le dimensioni di un'unità elettrica (tensione, corrente o flusso magnetico).
Questa trasformazione si rende necessaria quando il regolatore è un sistema elettronico, che richiede al suo ingresso grandezze elettriche. (*)
(*) Il regolatore di Watt è completamente meccanico e non necessita di trasduttori.
I trasduttori vengono anche chiamati "sensori".
L'attuatore è il sistema che può intervenire sul plant.
La variabile manipolabile del plant ha una unità di misura qualsiasi, che dipende dal sistema e non dal progettista del regolatore.
Quando il regolatore è un sistema elettrico le sue uscita sono grandezze elettriche. Il compito dell'attuatore è ricevere dal regolatore un segnale di tipo elettrico e trasformarlo nella grandezza richiesta dal sistema da controllare.
Nella seguente tabella si elencano alcuni tipi di attuatori:
Grandezza o dispositivo |
Attuatore |
Temperatura |
Resistore scaldante, piastra a effetto Peltier |
Posizione o angolo |
Motori in corrente continua o in corrente alternata, motori passo-passo, pistoni idraulici e pneumatici |
Dispositivi elettrici ON OFF |
Relais, transistor di potenza, altri dispositivi al silicio (TRIAC) |
Luce |
Lampade, LED, laser |
Pressione sonora |
Casse acustiche |
Tabella 5: alcuni tipi di attuatori
Se la variabile manipolabile non è una grandezza elettrica, serve un attuatore anche nei sistemi a catena aperta.
Nella seguente tabella si elencano alcuni tipi di trasduttori:
Grandezza |
Trasduttore |
Temperatura |
Termocoppie, termoresistenze, termistori al silicio |
Deformazione |
Estensimetri, "strain gage" |
Posizione ed angolo |
Potenziometri, resolver (LVDT), encoder |
Forza, coppia |
Celle di carico |
Luce |
Fotodiodi, fotomoltiplicatori |
Pressione sonora |
Microfono |
Pressione |
Sensore di pressione, a diaframma, a membrana |
Velocità |
Dinamo tachimetrica |
Portata di fluido |
a effetto Coriolis, a pesata, a effetto Doppler |
Tabella 6: alcuni tipi di trasduttori
Un altro elemento introdotto nella Figura 20 è il blocco circolare, che chiamiamo "sommatore".
Esso provvede ad eseguire la sottrazione fra due segnali. Uno è il valore dell'uscita desiderata (SetPoint, nella Figura 20), l'altro è il valore dell'uscita effettivamente presente in un certo istante, proveniente dal trasduttore (MisuraUscita, nella Figura 20).
Il sommatore produce un segnale detto "errore di regolazione", che vale:
Errore (t) = SetPoint(t) – MisuraUscita(t)
questa funzione indica quanto il sistema sia "lontano" dall'obiettivo della regolazione in ogni istante di tempo.
Il regolatore ha come ingresso l'errore di regolazione e dovrà fare tutto il possibile per annullarlo.
Se l'errore di regolazione è nullo l'obiettivo della regolazione è raggiunto.
Per la progettazione delle caratteristiche del regolatore esistono le sofisticate ed eleganti tecniche matematiche della "teoria dei controlli", che non tratteremo in questo testo. Esse portano alla realizzazione di sistemi di controllo ben ottimizzati, che raggiungono "presto e bene" l'obiettivo della regolazione.
I regolatori analogici, come quello illustrato nella Figura 20, sono fatti con circuiti elettronici detti "amplificatori operazionali". Essi sono sistemi dinamici continui le cui caratteristiche dinamiche che si possono adattare a quelle del sistema da controllare ("tuning"), per fare in modo che il sistema di controllo complessivo abbia le prestazioni desiderate.
Figura 20: regolatore analogico
La teoria dei controlli "classica", applicata a tutt'oggi nella maggior parte dei progetti di sistemi automatici, studia sistemi con un solo ingresso ed una sola uscita (cioè il caso della Figura 20). Nel caso che il sistema da controllare abbia molti ingressi e/o molte uscite spesso è possibile studiare ogni singolo ingresso ed ogni singola uscita come se fossero sistemi separati; se ciò non è possibile bisogna ricorrere alle tecniche della moderna teoria dei controlli multivariati.
La presenza di una retroazione cambia sensibilmente le caratteristiche di un sistema.
Può accadere che un sistema instabile diventi stabile per la presenza della retroazione, ed anche il contrario: un sistema che senza retroazione è stabile può divenire instabile.
Vediamo due esempi.
Il sistema raffigurato in DA FARE
Figura 21
viene detto "pendolo inverso". Si tratta di un pendolo con asta rigida, posto inizialmente nel suo punto di equilibrio instabile alla sommità della sua traiettoria.Se lasciato a sé stesso il sistema, in presenza di un minimo disturbo che faccia muovere il pendolo, si allontana dall'equilibrio. Dunque quell'equilibrio è instabile.
Se montiamo il pendolo su un carrello e lo dotiamo di un sensore di angolo, possiamo fornire l'uscita del sensore ad u un regolatore che controlla il movimento del carrello attraverso un motore (attuatore).
Il sistema, con l'introduzione della retroazione e del regolatore diviene stabile.
DA FARE
Figura 21: pendolo inverso
Il problema del pendolo inverso è interessante perché è un modello di un missile o di un'astronave quando, sulla piattaforma di lancio, viene liberato dai vincoli della rampa e deve ancora staccarsi da terra.
Vediamo il caso in cui la retroazione porta all'instabilità.
L'amplificatore è un sistema lineare e stabile, come abbiamo già visto.
Ma se il segnale di uscita dell'amplificatore, alle casse acustiche, viene riportato all'ingresso (microfono), si stabilisce una retroazione. L'amplificatore aumenta lo stesso segnale che sta amplificando, il livello acustico alle casse aumenta e viene ancora amplificato.
Nasce un fenomeno di instabilità che porta le casse acustiche o alla rottura, oppure ad oscillare fra il massimo ed il minimo spostamento che riescono ad avere.
Il risultato è che la cassa "fischia", fino a che non si allontana il microfono dalla cassa, interrompendo l'anello di retroazione.
DA FARE
Figura 22: instabilità in un amplificatore
Il fenomeno della retroazione viene anche usato negli oscillatori elettronici, per innescare l'instabilità che fa produrre un fenomeno oscillatorio persistente, analogo al fischio delle casse acustiche.
Dunque una retroazione può avere l'effetto di favorire la stabilità (pendolo inverso) o di pregiudicarla (fischio dell'amplificatore).
Si distinguono dunque due "tipi" di retroazione che si chiamano, rispettivamente, "retroazione negativa" e "retroazione positiva".
Per comprendere il nome assegnato ai due fenomeni dobbiamo riandare alla Figura 20, che rappresenta una retroazione negativa.
Il sommatore genera l'errore di regolazione sottraendo il segnale in retroazione al set point (da qui il termine r.a. "negativa": il segnale i retroazione è "negativo" nella somma).
In questo modo se immaginiamo che il sistema si scosti dalla condizione di equilibrio l'errore andrà nel senso opposto ed il sistema tenderà a riportarsi all'equilibrio.
La retroazione negativa tende ad attenuare gli effetti delle variazioni sull'uscita del sistema
In questo modo tende ad aumentare la stabilità del sistema complessivo.
Esempi di sistemi con retroazione negativa: i sistemi di controllo, il sistema di termoregolazione dei mammiferi.
Se invece la presenza della retroazione contribuisce ad allontanare dall'equilibrio, essa è positiva.
La retroazione positiva tende ad amplificare gli effetti delle variazioni sull'uscita del sistema
Una "blanda" retroazione positiva può servire per aumentare le prestazioni di un sistema e farlo reagire più rapidamente agli ingressi, mentre una r.a. positiva "forte" porta a inneschi di instabilità, che può far aumentare rapidamente l'energia del sistema ("esplosione") o farla calare ("blocco") (vedi Figura 23, (a)).
Sono esempi di fenomeni a retroazione positiva che provocano un'"esplosione": le reazioni nucleari a catena, le esplosioni demografiche, l'inflazione, la proliferazione delle cellule cancerose. Fenomeni che portano al "blocco" del sistema sono le crisi di borsa (un operatore comincia a vendere, tutti gli operatori cominciano a vendere), la recessione economica.
Figura 23: retroazione e stabilità
Le instabilità causate dalla retroazione positiva si concludono: con la "rottura" o il fermo del sistema oppure con l'insorgere di non linearità che limitano il fenomeno (saturazione) o lo rendono oscillatorio.
Regolatori numericiNei sistemi di controllo moderni sempre più spesso i regolatori analogici sono sostituiti da dispositivi che comprendono un piccolo computer. Questi regolatori vengono detti regolatori numerici o digitali.
A rigor di logica la trattazione dei sistemi discreti dovrebbe essere fatta nel capitolo seguente, che tratta dei sistemi discreti. I regolatori numerici sono infatti dei sistemi discreti, perché lo sono i computer, sistemi sui quali i regolatori numerici sono basati.
Nella Figura 24 è illustrato un regolatore digitale. Confrontandola con la Figura 20 si nota la presenza di due nuovi sottosistemi, etichettati come DAC e ADC; inoltre si nota che non esiste un segnale analogico che entra nel regolatore e neppure il blocco sommatore.
Un computer è un sistema numerico; accetta al suo ingresso e restituisce in uscita solo numeri binari.
I numeri binari trattati dal computer sono segnali discreti, perciò i segnali elettrici continui con cui funzionano trasduttore e attuatore non possono essere usati dal computer.
Questo è lo scopo dei due blocchi che si interpongono fra il computer e attuatore e trasduttore.
Il convertitore Analogico-Digitale (ADC Analog to Digital Converter) è un sistema che ha in ingresso una tensione elettrica e in uscita un numero binario. E' dunque adatto a fare da "interfaccia" fra trasduttore e computer.
Il convertitore Digitale-Analogico (DAC Digital to Analog Converter) è un sistema che ha in ingresso un numero binario e in uscita una tensione od un'altra grandezza elettrica.
Figura 24: regolatore digitale
La funzione del segnale di set point viene svolta dalla memoria del computer.
In una locazione di quella memoria è presente il valore del Set Point, che può essere modificato per mezzo del programma che il computer fa eseguire (programma di controllo).
La funzione del blocco sommatore viene eseguita dal computer stesso nel corso dell'esecuzione del programma.
Il computer ha capacità algebriche, per cui il suo programma può effettuare la sottrazione fra il valore del Set Point, mantenuto in memoria, ed il numero proveniente, attraverso il DAC, dall'anello di retroazione.
Simulazione